'\" t
.\"     Title: 
    adintool
  
.\"    Author: 
.\" Generator: DocBook XSL Stylesheets v1.76.1 <http://docbook.sf.net/>
.\"      Date: 19/12/2013
.\"    Manual: 
.\"    Source: 
.\"  Language: Japanese
.\"
.TH "ADINTOOL" "1" "19/12/2013" ""
.\" -----------------------------------------------------------------
.\" * Define some portability stuff
.\" -----------------------------------------------------------------
.\" ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
.\" http://bugs.debian.org/507673
.\" http://lists.gnu.org/archive/html/groff/2009-02/msg00013.html
.\" ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
.ie \n(.g .ds Aq \(aq
.el       .ds Aq '
.\" -----------------------------------------------------------------
.\" * set default formatting
.\" -----------------------------------------------------------------
.\" disable hyphenation
.nh
.\" disable justification (adjust text to left margin only)
.ad l
.\" -----------------------------------------------------------------
.\" * MAIN CONTENT STARTS HERE *
.\" -----------------------------------------------------------------
.SH "名前"

    adintool
   \- 音声波形データの記録・分割・送信・受信ツール
.SH "概要"
.HP \w'\fBadintool\fR\ 'u
\fBadintool\fR {\-in\ \fIinputdev\fR} {\-out\ \fIoutputdev\fR} [\fIoptions\fR...]
.SH "DESCRIPTION"
.PP
adintool は，音声波形データ中の音声区間の検出および記録を連続的に行 うツールです．入力音声に対して零交差数と振幅レベルに基づく音声区間検 出を逐次行い，音声区間部分を連続出力します．
.PP
adintool は adinrec の高機能版です．音声データの入力元として，マイク 入力・ 音声波形ファイル・標準入力・ネットワーク入力(adinnet サーバー モード)が選択できます．Julius の
\fB\-input\fR
オプションも 使用可能で，プラグイン入力も選択できます．
.PP
出力先として，音声波形ファイル・標準出力・ネットワーク出力(adinnet ク ライアントモード)が選択できます．特にネットワーク出力（adinnet クライ アントモード）では， julius へネットワーク経由で音声を送信して音声認識 させることができます．
.PP
入力音声は音声区間ごとに自動分割され，逐次出力されます．音声区間の切 り出しには adinrec と同じ，一定時間内の零交差数とパワー（振幅レベル） のしきい値を用います．音声区間開始と同時に音声出力が開始されます．出 力としてファイル出力を選んだ場合は，連番ファイル名で検出された区間ごと に保存します．
.PP
サンプリング周波数は任意に設定可能です．録音形式は 16bit, 1 channel で，書き出されるファイル形式は Microsoft WAV 形式です． 既に同じ名前のファイルが存在する場合は上書きされます．
.SH "OPTIONS"
.PP
Julius の全てのオプションが指定可能である．指定されたもののうち， 音声入力に関係するオプションのみ扱われる．以下に，adintool の オプション，および有効な Julius オプションを解説する．
.SS "adintool specific options"
.PP
\fB \-freq \fR \fIHz\fR
.RS 4
音声のサンプリング周波数 (Hz) を指定する．(default: 16,000)
.RE
.PP
\fB \-in \fR \fIinputdev\fR
.RS 4
音声を読み込む入力デバイスを指定する．"mic" でマイク入力， "file" でファイル入力, "stdin" で標準入力から音声を読み込む． ファイル入力の場合，ファイル名は起動後に出てくるプロンプトに対 して指定する．また，"adinnet" で adintool は adinnet サーバー となり，adinnet クライアントから音声データを tcp/ip 経由で 受け取る．ポート番号は 5530 である（"\fB\-inport\fR" で変更可能）．
.sp
入力デバイスは，そのほか Julius の "\-input" オプションでも指定可能 である．その場合，プラグインからの入力も可能である．
.RE
.PP
\fB \-out \fR \fIoutputdev\fR
.RS 4
音声を出力するデバイスを指定する．"file" でファイル出力， stdout で標準出力へ出力する．ファイルの場合，出力ファイル名は オプション "\fB\-filename\fR" で与える．出力ファイル 形式は 16bit WAV 形式である． また，"adinnet" で adintool は adinnet クライアント となり，adinnet サーバへ取り込んだ音声データを tcp/ip 経由で 送信できる．送信先ホストは "\fB\-server\fR" で指定する． ポート番号は 5530 である（"\fB\-port\fR" で変更可能）． "vecnet" では，音声入力から抽出した特徴量ベクトルをサーバへ送信できる．
.RE
.PP
\fB \-inport \fR \fInum\fR
.RS 4
入力が adinnet の場合 (\-in adinnet)，接続を受けるポート番号 を指定する．指定しない場合のデフォルトは 5530 である．
.RE
.PP
\fB \-server \fR [host] [,host...]
.RS 4
出力が adinnet の場合 (\-out adinnet)，送信先のサーバ名を指定する． 複数ある場合は，カンマで区切って指定する．
.RE
.PP
\fB \-port \fR [num] [,num...]
.RS 4
出力が adinnet の場合 (\-out adinnet)，送信先の各サーバのポート番号 を指定する．指定しない場合のデフォルトは 5530 である．
\fB\-server\fR
で複数のサーバを指定している場合， 全てについて明示的にポート番号を指定する必要がある．
.RE
.PP
\fB \-filename \fR \fIfile\fR
.RS 4
ファイル出力 (\fB\-out file\fR) 時，出力ファイル名を 与える．デフォルトでは，検出された音声区間検出ごとに， "file\&.0000\&.wav" , "file\&.0001\&.wav" \&.\&.\&. のように区間ごとに連番で 記録される．番号の初期値は 0 である（\fB\-startid\fRで 変更可能）．なお，オプション
\fB\-oneshot\fR
指定時は 最初の区間だけが "file" の名前で保存される．
.RE
.PP
\fB \-startid \fR \fInumber\fR
.RS 4
ファイル出力時，記録を開始する連番番号の初期値を指定する．（ デフォルト：0）
.RE
.PP
\fB \-oneshot \fR
.RS 4
最初の音声区間が終了したら終了する．
.RE
.PP
\fB \-nosegment \fR
.RS 4
入力音声の音声区間検出（無音による区切りと無音区間のスキップ）を 行わない．
.RE
.PP
\fB \-raw \fR
.RS 4
RAWファイル形式で出力する．
.RE
.PP
\fB \-autopause \fR
.RS 4
出力が adinnet の場合（\-out adinnet），音声区間が終了するたび に入力停止・動作停止状態に移行する．出力先の adinnet サーバか ら動作再開信号がくると音声入力を再開する．
.RE
.PP
\fB \-loosesync \fR
.RS 4
出力が adinnet （\-out adinnet）で複数の出力先サーバへ出力している 場合，動作停止状態から動作再開信号によって動作を再開する際，adintool は すべてのサーバから動作再開信号を受けるまで動作を再開しない． このオプションを指定すると，少なくとも１つのサーバから再開信号 がくれば動作を再開するようになる．
.RE
.PP
\fB \-rewind \fR \fImsec\fR
.RS 4
入力がマイクのとき，停止状態から動作を再開するとき，停止中から 持続して音声入力中だった場合，指定されたミリ秒分だけさかのぼって 録音を開始する．
.RE
.PP
\fB \-paramtype \fR \fIparameter_type\fR
.RS 4
出力が vecnet の時（\fB\-out vecnet\fR），抽出する特 徴量の型をHTK形式で指定する（例:"MFCC_E_D_N_Z"）．
.RE
.PP
\fB \-veclen \fR \fIvector_length\fR
.RS 4
出力が vecnet の時（\fB\-out vecnet\fR），出力するベ クトル長（次元数）を指定する．
.RE
.SS "Concerning Julius options"
.PP
\fB \-input \fR {mic|rawfile|adinnet|stdin|netaudio|esd|alsa|oss}
.RS 4
音声入力ソースを選択する．"\-in" の代わりにこちらを使うことも できる（最後に指定したほうが優先される）．esd やプラグイン入力が 指定可能である．
.RE
.PP
\fB \-lv \fR \fIthres\fR
.RS 4
振幅レベルのしきい値．値は 0 から 32767 の範囲で指定する． (default: 2000)
.RE
.PP
\fB \-zc \fR \fIthres\fR
.RS 4
零交差数のしきい値．値は１秒あたりの交差数で指定する． (default: 60)
.RE
.PP
\fB \-headmargin \fR \fImsec\fR
.RS 4
音声区間開始部のマージン．単位はミリ秒． (default: 300)
.RE
.PP
\fB \-tailmargin \fR \fImsec\fR
.RS 4
音声区間終了部のマージン．単位はミリ秒． (default: 400)
.RE
.PP
\fB \-zmean \fR
.RS 4
入力音声ストリームに対して直流成分除去を行う．全ての音声処理の の前段として処理される．
.RE
.PP
\fB \-smpFreq \fR \fIHz\fR
.RS 4
音声のサンプリング周波数 (Hz) を指定する．(default: 16,000)
.RE
.PP
\fB \-48 \fR
.RS 4
48kHzで入力を行い，16kHzにダウンサンプリングする． これは 16kHz のモデルを使用しているときのみ有効である． ダウンダンプリングの内部機能は
sptk
から 移植された． (Rev\&. 4\&.0)
.RE
.PP
\fB \-NA \fR \fIdevicename\fR
.RS 4
DatLink サーバのデバイス名 (\fB\-input netaudio\fR)\&.
.RE
.PP
\fB \-adport \fR \fIport_number\fR
.RS 4

\fB\-input adinnet\fR
使用時，接続を受け付ける adinnet のボート番号を指定する．(default: 5530)
.RE
.PP
\fB \-nostrip \fR
.RS 4
音声取り込み時，デバイスやファイルによっては，音声波形中に振幅 が "0" となるフレームが存在することがある．Julius は通常，音声 入力に含まれるそのようなフレームを除去する．この零サンプル除去が うまく動かない場合，このオプションを指定することで自動消去を 無効化することができる．
.RE
.PP
\fB \-C \fR \fIjconffile\fR
.RS 4
jconf設定ファイルを読み込む．ファイルの内容がこの場所に展開される．
.RE
.PP
\fB \-plugindir \fR \fIdirlist\fR
.RS 4
プラグインを読み込むディレクトリを指定する．複数の場合は コロンで区切って並べて指定する．
.RE
.SH "ENVIRONMENT VARIABLES"
.PP
\fB \fR\fB\fBALSADEV\fR\fR\fB \fR
.RS 4
(マイク入力で alsa デバイス使用時) 録音デバイス名を指定する． 指定がない場合は "default"．
.RE
.PP
\fB \fR\fB\fBAUDIODEV\fR\fR\fB \fR
.RS 4
(マイク入力で oss デバイス使用時) 録音デバイス名を指定する． 指定がない場合は "/dev/dsp"．
.RE
.PP
\fB \fR\fB\fBPORTAUDIO_DEV\fR\fR\fB \fR
.RS 4
(portaudio V19 使用時) 録音デバイス名を指定する． 具体的な指定方法は adinrec の初期化時にログに出力されるので参照のこと．
.RE
.PP
\fB \fR\fB\fBLATENCY_MSEC\fR\fR\fB \fR
.RS 4
Linux (alsa/oss) および Windows で，マイク入力時の遅延時間をミ リ秒単位で指定する．短い値を設定することで入力遅延を小さくでき るが，CPU の負荷が大きくなり，また環境によってはプロセスやOSの 挙動が不安定になることがある．最適な値はOS やデバイスに大きく 依存する．デフォルト値は動作環境に依存する．
.RE
.SH "EXAMPLES"
.PP
マイクからの音声入力を，発話ごとに "data\&.0000\&.wav" から順に記録する：
.sp .if n \{\ .RS 4 .\} .nf % \fBadintool\fR \-in mic \-out file \-filename data .fi .if n \{\ .RE .\}
巨大な収録音声ファイル "foobar\&.raw" を，音声区間ごとに "foobar\&.1500\&.wav" "foobar\&.1501\&.wav" \&.\&.\&. に分割する：
.sp .if n \{\ .RS 4 .\} .nf % \fBadintool\fR \-in file \-out file \-filename foobar \-startid 1500 % enter filename\->foobar\&.raw .fi .if n \{\ .RE .\}
ネットワーク経由で音声ファイルを転送する(区間検出なし)：
.sp .if n \{\ .RS 4 .\} .nf (sender) % \fBadintool\fR \-in file \-out adinnet \-server \fIreceiver_hostname\fR \-nosegment (receiver) % \fBadintool\fR \-in adinnet \-out file \-nosegment .fi .if n \{\ .RE .\}
マイクからの入力音声を Julius へ送信して認識：
.sp .if n \{\ .RS 4 .\} .nf (sender) % \fBadintool\fR \-in mic \-out adinnet \-server \fIreceiver_hostname\fR (receiver) % \fBjulius\fR \-C \&.\&.\&. \-input adinnet .fi .if n \{\ .RE .\}
.SH "SEE ALSO"
.PP

\fB julius \fR( 1 )
,
\fB adinrec \fR( 1 )
.SH "COPYRIGHT"
.PP
Copyright (c) 1991\-2013 京都大学 河原研究室
.PP
Copyright (c) 1997\-2000 情報処理振興事業協会(IPA)
.PP
Copyright (c) 2000\-2005 奈良先端科学技術大学院大学 鹿野研究室
.PP
Copyright (c) 2005\-2013 名古屋工業大学 Julius開発チーム
.SH "LICENSE"
.PP
Julius の使用許諾に準じます．
